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Abstract of FR2563349 

The multiplier, useable especially for matrixing 
and dematrixing of digital video signals, makes 
it possible to carry out a numerical operation of 
the type A*X + B*Y + C*Z. It comprises a first 
assembly MAT1 consisting of a systolic 
calculating matrix with n x n elementary cells 
(n being the number of coding bits) each 
carrying out an elementary matrix operation 
A*X + B*Y + C*Z, feeding a second assembly 
intended for propagating carries and results of 
elementary calculations for obtaining high- 
significance bits, the second assembly MAT2 
in turn feeding a third assembly consisting of a 
triangular matrix with n register lines for 
presentation of high-significant bits on 
corresponding outputs. 
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(57) Le muta'pfieur. utilisable notamment pour le matricage et 
le dematricage de signaux video numeriques. permet de reali- 
ser une operation nurnerique du type A # X + B*Y + C*Z. II 
comporte un premier ensemble MATT constitue d'une matrice 
de calcul systolique a n x n cellules elementaires in etaht le 
nombre d'ebs de codage) realisant chacune une operation 
matricielle eiementaire A*X + B*Y + C*Z, alimentant un 
second ensemble destine a la propagation des retenues et des 
resuttats des calculs elementaires d'obtentton des ebs de 
poids fort le second ensemble MAT2 alimentant a son tour un 
troisieme ensemble constitue par une matrice triangulaire a n 
lignes de registres de presentation des ebs de poids fort sur 
des sorties correspondantes. 
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Multiplie ur matriciel systolique de traitement de 
donnges numdriques 

L'invention a pour objet un multiplieur matri- 
ciel systolique, permettant de rdaliser de fagon simple, 
5 repetitive et rapide, une operation numgrique de type : 

A*X + B*Y + C*Z (1) 

ou A, B et C sont des variables d'entr^e et X, Y et Z 
sont des coefficients qui peuvent §tre figgs ou au con- 
traire programmables . 

10 Un tel multiplieur est utilisable pour traiter 

des donnges et des variables numgriques cod<§es sur un 
nombre d'616ments binaires (ebs ou bits) quelconque. II 
trouve une application part iculierement importante dans 
le traitement de signaux numgriques video, notamment 

15 pour le matricage et le dgmatrigage de tels signaux ; 
parmi les autres applications possibles, on peut citer 
le filtrage d'images en temps rgel et I'extraction de 
contours. II faut a ce sujet noter que 1'operation 
rgalisge peut avoir un nombre de termea supgrieur a 

20 trois et notamment etre de la forme : 

A*X + B*Y + C*Z + D*W. 

On sait qu'un systeme systolique est ainsi dg- 
nommg du fait de l'analogie de son f onctionnement avec 
la distribution du sang sous la commande des battements 

25 du coeur. Un multiplieur systolique permettant de rgali- 
ser l'opgration numgrique A*X + B*Y + C*Z a etg dgcrit 
par Kung dans "Why systolic architectures ?" - IEEE 
TRANSACTIONS ON COMPUTERS, Janvier 1982, numgro special 
sur le calcul en parallele. Ce multiplieur utilise trois 

30 mult iplieurs dans trois cellules diffgrentes. II est 
done tres complexe. II en est de m§me des cornbinaisons 
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de multiplieurs numeriques travaillant sur 8 et 16 ebs 
actuellement disponibles : la constitution d'un multi- 
plieur erfectuant l'operation A*X + B*Y + C*Z aur des 
donnees codees sur 8 ebs exige trois multiplieurs et 
5 deux addi tionneurs • 

L'invention vise a fournir un multiplieur ma- 
triciel systolique permettant de realiser une operation 
du type A*X + B*Y + C*Z a une rapidity compatible avec 
les exigences du traitement video numerique, realisable 

10 de fa$on industrielle avec integration sur micropla- 
quette de silicium, a un coQt plus faible que par asso- 
ciation de composants standard et avec une dissipation 
de puissance moindre. 

Pour cela, l'invention propose un multiplieur 

15 qui, loin de se borner a juxtaposer des circuits exis- 
tants, associe suivant une approche originale et de 
fa$on repetitive des cellules unitaires simples, aise- 
ment realisables en technologie N-MOS a longueur de 
canal faible (typiquement 3 urn) permettant d'atteindre 

20 une frequence d'environ 20 MHz, dans lesquelles la me- 
thode systolique est mise en oeuvre au niveau de l'eie- 
ment binaire. 

Le multiplieur comporte un premier ensemble 
constitue d'une matrice de calcul systolique a n x n 

25 cellules eiementaires (n etant le nombre d'ebs de 
codage) realisant chacune une operation matricielle 
eiementaire A*X + B*Y + C*Z,^ alimentant un second en- 
semble destine a la propagation des retenues et des 
resultats des calculs eiementaires d'obtention des ebs 

30 de poids fort ; ce second ensemble alimente a son tour 
un troisieme ensemble constitue par une matrice tMan- 
gulaire a n lignes de registres de presentation des ebs 
de poids fort sur des sorties correspondent es . 

Les registres, qui constituent l'eiement de base 

35 d'une telle architecture, apportent un avantage impor- 
tant i ils peuvent §tre congus pour autoriser un test du 
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multiplieur par chargement en sdrie de tous les regis- 
tres puis dechargement identique aprfes un cycle de 
l'horloge qui les commande. 

L'invention sera mieux comprise h la lecture de 
5 la description qui suit de modes particuliers d' execu- 
tion donnas h titre d'exemples non lim-irte*if s. La des- 
cription se r£ffere aux dessins qui 1 1 accompagnent , dans 
lesquels : 

- les Figures 1A et IB dans leur ensemble sont 
10 un schema fonctionnel g£n£ral d'un multiplieur suivant 

l'invention permettant de traiter des variables et des 
coefficients cod£s sur 8 ebs ; 

- la Figure 2 est un schema fonctionnel interne 
d'une cellule de base, dgsignge par CEL1, du premier en- 

15 semble du multiplieur; 

- les Figures 3, 4 et 5 sont des schemes fonc- 
tionnels de cellules 616mentaires CEL 2 f ADD et RG du 
second ensemble du multiplieur ; 

- la Figure 6 est un schema 61ectrique de la 
20 cellule RG de la Figure 5. 

Le multiplieur montre" en Figure 1 peut §tre 
regard^ comme constitu£ de trois ensembles HAT 1, RET 2 
et RG 3. 

Le premier ensemble MAT 1 regoit en parallfele, h 
25 partir d'un bus h 24 fils, les trois variables A, B et C 
sur des entries identifies par AO, BO, CO,.., A7, B7, 
C7. II re^oit 6galement les coefficients constants h 
partir de 24 fils de programmat ion selon le m§me format 
que les variables. Cet ensemble MAT 1 est constitue* 
30 d'une matrice h 8 lignes et 8 colonnes de cellules 616- 
mentaires CELl(i,j), ou i et j varient de 0 h 7, & la- 
quelle sont ajouttSs (sur la gauche de la Figure) huit 
registres 8. 

L 1 ensemble MAT 1 est une partie essentielle du 
35 multiplieur. II constitue une matrice de calcul systo- 
lique dont cheque cellule CELl(i,j) realise une op<§r- 
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tion matricielle el6mentairn dont on pourra trouver une 
description complete dans la publication de CARLAC'H et 
autres "Description prdl iminai re des circuits intggrgs 
de matrigage et de ddmatrigage de signaux video- 
5 numSriques" , document du C.C.C.f .T. NT/CNR/VRE/29/83 de 
Juin 1983 • 

La cellule grgmentaire realise les trois multi- 
plications en parell&le. On supposera qu'elle traite des 
nombres binaires cod€s en complement b 2. Elle peut 

10 alors avoir la constitution montr£e en Figure 2. La cel- 
lule comporte des registres dynamiques 61£mentaires 10 
months en s€rie et qui peuvent &tre du type d€crit plus 
loin en faisant reference aux Figures 5 et 6. Les sor- 
ties des registres attaquent un jeu de trois addition- 

15 neurs & retenue 12, 1A et 16, d£sign6s par ADD3, et un 
additionneur simple 18, d£sign£ par ADD2, par 1'inter- 
m^diaire d'un jeu de portes* Les entries et sorties sont 
designees sur la Figure 2 par les m@mes symboles que sur 
la Figure 1, mais affect^s d'indicea indiquant la 

20 cellule d'origine ou de destination. 

Des entries "TEST" sont pr^vues sur les regis- 
tres 10, comme sur tous les autres registres RG du mul- 
tiplieur. Ces entries sont port£es au niveau logique 0 
lorsque le multiplieur doit fonctionner en mode de 

25 calcul. Dans ce cas, la relation combinatoire entre les 
entries de donn^es et les sorties S est la suivante pour 
la cellule CELl(i,j) : 

S(i+l,j-l) + A(i,j-l)*X(i) + B(i,j-l)*Y(i) + 
30 C(i,j-l)*Z(i) + Rl(i,3-1) + R2(i-l,j-l) = R2(i,j)22 
+Rl(i, j)2 1 + 5(i,j)2 0. 

Les notations sont celles indiquc5es sur la Fi- 
gure 2 et toutes les donne*?s appliqu£es b uno nf*me cel- 
35 lule appartiennent b 1 'ensemble 0,1 . 

Le second ensemble RET 2 a pour fonction de 
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terminer la propagation de3 retenues et les rdsultats 
des calculs intermediates pour l'obtention des ebs de 
poids fort (MSB) . II est constituS de vingt-deux 
cellules eiementaires CEL2 (Figure 3), groupies en une 
matrice triangulaire de 8 colonnes et 4 lignes, 
associees b quatre addi t ionneurs simples ADD (Figure 4) 
et h un registre RG (Figure 5). 

Chaque cellule courante CEL2(i,j) peut avoir la 
constitution montrge en Figure 3, ou les entries et sor- 
ties sont encore designees par les m§mes notations que 
sur les Figures precedentes, affectees d'indices indi- 
quant l'origine ou la destination. Elle se compose de 
registres dynamiques 20 months en cascade, d r un addi- 
tionneur simple 22 et d'un additionneur h retenue 24. 

De m§me, chaque cellule ADD (Figure 4) peut §tre 
constitute de deux registres dynamiques 26 en cascade 
dont les sorties attaquent un sommateur 28 fournissant 
le signal de sortie, dirigS vers la premi&re cellule 
CEL2 d'une ligne (pour quatre des cellules ADD), four- 
nissant le dernier element binaire de poids fort 57 du 
rSsultat (pour la derniere cellule ADD). 

Enfin, le registre RG a une constitution qu'on 
peut retrouver dans les registres du troisieme ensemble 
RG3. Du point de vue fonctionnel (Figure 5), il peut 
fitre considers comme constitue d*inverseurs 30 relics 
par des inter rupteurs commandos par des horloges de 
cadencement non recouvrantes h l'etat haut ( indiquees 
par Fl et F2) et le signal de test* 11 peut avoir la 
constitution eiectrique montree en Figure 6 od les 
entrees-sorties portent les mSmes references que sur la 
Figure 5» 

Enfin, le troisieme ensemble RG3 est destine h 
fournir les ebs de poids fort du resultat sur des 
sorties S0-S6. II est constitue d'une matrice triangu- 
laire h 7 lignes et 4 colonnes de dix-neuf registres RG 
qui peuvent §tre identiques h ceux montr£s oar les 
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Figures 5 et 6. Les registres RG sont commandos par les 
m6mes horloges que les registres des cellules d£ja d6- 
crites. lis permettent le fonct ionnement systolique du 
multiplieur . 

5 Le role des composants apparaltra mieux en con- 

sidgrant le f onct ionnement global du multiplieur, qui 
sera maintenant £voqu€* 

Les huit cellules d'entre*e CELl(0,i) qui 
regoivent chacune trois ebs de poids identiques Ai, Bi, 

10 Ci des variables d'entr£e, traitent ces ebs au niveau 
haut de l'horloge Fl qui suit la presence des ebs sur le 
bus d* entree. 

Les trois entries de coefficient de chaque 
cellule CELl(i,j) ( entries horizontales sur la Figure 1) 

15 regoivent les coefficients selon le m6me format que les 
variables, c'est-a-dire le triplet Xi> Yi, Zi des ebs de 
m§me poids pour toutes les cellules d'une m£me colonne 
_i. En d'autres termes, les cellules CELl(0,i) a 
CELl(7,i) regoivent les m§mes ebs Xi, Yi, Zi. 

20 A chaque niveau haut de l'horloge Fl, un nouveau 

triplet de variables numdriques A, B, C est introduit 
dans la premiere ligne de cellule CELl(0,i). Les r6sul- 
tats partiels se propagent dans le multiplieur au rythrae 
du signal d'horloge. La traversed synchrone des treize 

25 stages successifs est assured par les registres RG com- 
mandos par la double horloge Fl et F2 ne pr£sentant pas 
de recouvrement a l'gtat haut* 

A chaque cycle d'horloge, apres travers£e de 
tous les stages, les rdsultats de l'opgration A*X + B*Y 

30 + C*Z sont presents sur les fils de sortie 50 a S7 
(Figure 1). Les sorties P0 a P9 qui represent ent les 
poids faibles du rSsultat sur 17 ebs ne sont pas prises 
en compte dans le cas nontre* en Figure 1. Elles 
pourraient l*§tre en augmentant la taille de l'ensemble 

35 RG3. 

L'opgration logique est done effectu£e en 13 
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cycles d'horloge pour des donn€es (variables et coeffi- 
cients cod€es sur 8 ebs. II s'y ajoute le cycle d'hor- 
loge de l'6tage de sortie du circuit inte*gr£. 

En mode "calcul" ( traitement continu de donnges 
numtriques), tout se passe comme si i'opgrateur effec- 
tuait un calcul a cheque cycle d'horloge. 

II peut §tre utile a ce stade de faire appa- 
raitre le f onctionnement de chaque cellule 61gmentaire 
CELl(i,j) en mode "calcul" et en mode "test". 

En mode calcul (Figure 2), lorsque l'entr£e 
"test" est au niveau logique z^ro, les entries de 
donn€es de la cellule d'ordre (i,j) : 

S(i+1, j-1) 
Rl(i, j-D 
A (i, j-1) 
B (i, j-1) 
C (i, j-1) 
R2(i-1, j-1) 

sont charg£es dans les registres 10 lorsque 1' entree 
d'horloge Fl est a 1, I'entrge F2 6tant alors a 0* Cha- 
que registre 10 continue a mtmoriser dans sa partie es- 
clave la valeur binaire de l'entre'e quand Fl repasse a 0 
et que F2 reste a 0* Les sorties des registres 10 
prennent les valeurs des entries pr6c€demment chargges 
quand l'horloge F2 passe a 1 et que Fl reste a 0. Les 
sorties sont alors calcul£es dans le r£seau corobinatoire 
constitute des quatre additionneurs 12, 14, 16 et 18* 

Cette dgcoupe f onct ionnelle du r€seau combina- 
toire est optimale du point de vue de la minimisation de 
la consommation en courant et de la minimisation de la 
surface de la cellule i ntdgrde sur semiconducteur • La 
cellule CEL1 assure nganmoins une rapidite compatible 
avec la frequence de 20 MHz des horloges biphas€es (Fl, 
F2) non recouvrantes a l'6tat !• 
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Comme on l'a d<§ja indiqud plus haut, il eat im- 
portant du point de vue de 1' industrialisation que le 
multiplieur puisse etre comp.letement teste" de facon 
simple. Ce rtSsultat est atteint, dans l'invention, en 
prSvoyant une entree de test qui permet, lorsqu'elle est 
raise au niveau logique 1, de modifier le sens des trans- 
fers d* information dans les cellules. 

Lorsque l'entree TEST est a ze>o, tous les 
registres RG sont connected en parallels (mode de cal- 
cul). Lorsque 1'entrUe TEST est a 1, tous les registres 
RG sont connected en sdrie, ce qui permet t 

- de charger tous les registres RG avec 1 'entree 
marquee "Entr<5e s«5rie», apres des d^calages commandos 
per (Fl, F2). Le contenu des registres RG est done ob- 
servable a la sortie "Sortie serie" de la cellule, ce 
qui rend le test des registres RG tres simple, exhaustif 
et rapide, 

- de positionner les sorties des registres RG 
sfin de presenter tous les cas possibles de configura- 
tions des entries logiques du rlseau d'additionneurs. 
Apres chargement dans les registres des cellules sui- 
vsntes, les resultats logiques du r<iseau d'additionneurs 
sont observables sur la sortie "Sortie se>ie", apres des 
dScalages commandos par (Fl, F2). Le test de la cellule 
pour verifier qu'elle assume la fonction combinatoire 
requise est done Sgalement simple, exhaustif et rapide. 

L'invention est susceptible de nombreuses va- 
riantes et peut s'Stendre a la realisation d'un op^ra- 
teur a plus de trois termes et au traitement de donnSes 
numgriques codecs sur un nombre d'ebs quelconque. 

II faut remarquer a ce sujet que 1 ' augmentat ion 
de trois a quatre du nombre de termes n'accroit ni la 
taille, ni la complexity du schema global. On passe b 
l'opgrateur a quatre termes : 



A*X + B*Y + C*Z + D*W 
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par une modification mineure de 1 1 addi t ionneur 18 h deux 
entries (Figure 2) pour le transformer en un addition- 
neur h trois entries et conduire la cellule dldmentaire 
a remplir la relation combinatoire : 

5 S(i + j,j-l);+ A(i,j-l)*X(l) + B(i,j-l)*Y(i) + 
C(i»j-l)*Z(i) + D(i f J-l)*W(j) + Rl(i,j-1) + R2(i-l,j-l) 
= R2(i,j)2 2 + Rl(i,j)2 1 + 5(i,j)2° 

Quant h 1 1 augment at ion du nombre d'ebs de co- 
10 dage, elle conduit a modifier uniquement la taille, et 
non la structure, du multiplieur. Le temps de calcul 
instantang n'est pas modifie* : seul le nombre de cycles 
d'horloge n£cessaire au calcul complet varie avec la 
taille de l'op^rateur. 
15 L ' implantation du multiplieur en technologie 

N.MOS sur silicium en un seul circuit intggre* peut se 
faire sans difficulty et on notera l'avantage que repr£- 
sente le fait que les connexions aient lieu entre cel- 
lules mitoyennes. 
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REVEND1CATI0NS 

1. Multiplieur matriciel systolique permettant 
de r£aliser une operation numgrique du type : 

A*X + B*Y + C*2 

5 caractgrise" en ce qu'il comporte un premier ensemble 
(MAT1) constitud d'une matrice de calcul systolique a n 
x n cellules 616mentaires (rt 6tant le nomtrre d'ebs de 
codage) rgalisant chacune une operation matricielle 
616mentaire A*X + B*Y + C*Z, alimentant un second ensem- 

10 ble destine a le propagation des retenues et des r£sul- 
tats des calculs 61£mentaires d'obtention des ebs de 
poids fort, le second ensemble (MAT2) alimentant a son 
tour un troisieme ensemble constitud par une matrice 
triangulaire a n lignes de registres de presentation des 

15 ebs de poids fort sur des sorties cor respondantes . 

2. Multiplieur matriciel systolique suivant la 
revendication 1, caract£ris£ en ce que cheque cellule 
(CEL1) du premier ensemble comporte des registres dyna- 
miques (10) connectables en s£rie ou en parallfele, dont 

20 les sorties attaquent quatre additionneurs. 

3. Multiplieur matriciel systolique suivant la 
revendication 1 ou 2, caracte'r ise* en ce que le second 
ensemble (MAT2) est constitu€ par une matrice triangu- 
laire a _n colonnes de cellules 61£mentaires (CEL2) 

25 associ£es a des additionneurs simples (ADD) et a un re- 

gistre dynamique* 

A. Multiplieur matriciel systolique suivant la 

revendication 3, caract£ris€ en ce que chaque cellule 

(CEL2) du second ensemble se compose de registres dyna- 
30 miques (20) months en cascade, d'un additionneur a deux 

entries (22) et d'un additionneur a trois entries (24), 
5. Multiplieur matriciel suivant 1 1 une quelcon- 

que des revendicat ions 1 a A, caract^rise en ce que le 

troisieme ensemble (RG3) est constitue 1 d'une matrice 
35 triangulaire a n-1 colonnes de registres nomm«ndes, en 

m§me temps que les autres registres du multiplieur par 
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deux horloges synchrones de cadencement non recouvrantes 
h l'gtat haut, permettant le f onct ionnement systolique 
et formant les ebs de poids fort du r£sultat* 

6« Multiplieur matriciel suivant I'une quelcon- 
5 que des revendications 2 a 5, caract£ris£ en ce que tous 
les registres sont munis d'une entree de test permettant 
de modifier les transferts d 1 information dans les cel- 
lules. 

7* Multiplieur matriciel suivant I'une quelcon- 
10 que des revendications pr£c£dentes, caract^rise' en ce 
que cheque cellule 616menteire (CEL1) du premier ensem- 
ble est pr£vue pour r£sliser entre ses entries E et ses 
sorties S la relation combinatoire : 



15 



S(i+l,j-l) + A(i,j-l)*X(i) + B(i, j-l)»Y(i) + 
G(i, j-l)*Z(i) + RKi.J-l) + R2(i-l,j-l) = R2(i,j)2 2 
+Rl(i,j)2 i + S(i,j)2 °. 
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